LiftQuant: Ancho de bits continuo en LLM mediante elevación dimensional Descubre LiftQuant: cuantización continua de LLM que permite comprimir modelos de 70B a tan solo 2.4 bits, ajustándose perfectamente a tu memoria GPU. 2026-06-04 · 2 min